Die Gratwanderung zwischen qualitativ hochwertigen und einfach zu erstellenden domänenspezifischen Textanalysen
نویسنده
چکیده
Die Textanalyse ist zu einem entscheidenden Werkzeug in verschiedenen Domänen wie den Geisteswissenschaften, Naturwissenschaften sowie auch in der Industrie geworden. Eine der größten Herausforderungen bei domänenspezifischen Textanalyseprojekten besteht darin, das Wissen aus den Bereichen IT und Text Mining mit dem Wissen aus der Domäne zusammenzubringen. Viele Textanalysetoolkits werden deshalb speziell für den Gebrauch durch Domänenexperten ohne oder mit wenig IT und Textanalysewissen vereinfacht. In diesem Beitrag diskutieren wir, inwiefern diese Vereinfachungen zu Qualitätsproblemen bei der Analyse von unsauberen Daten führen können.
منابع مشابه
Teleteaching an der Universität Göttingen: Systemarchitektur und Problematiken
Im Rahmen des ELAN Projekts des Landes Niedersachsen wird der Aufbau eines Lehrverbundes Informatik zwischen der Universität Göttingen und der Technischen Universität Clausthal durchgeführt. Im Bereich der Informatik sollen Kapazitäten und Ressourcen zusammengeführt werden, um standortübergreifend für beide Hochschulen eine umfangreiche und hochwertige Informatikausbildung zu gewährleisten. In ...
متن کاملPLuTO - Portable Lern- und Wissensplattform zum Transfer episodischen Wissens in Organisationen
Das Projekt PLuTO unterstützt mittels multimedialer Wissensaufnahme und multimodalem Zugriff den Austausch von episodischem Wissen zwischen älteren und jüngeren Mitarbeitern. Dabei wird das Wissen direkt in den Werkhallen der Unternehmen aufgenommen. Der Wissensabruf erfolgt über Tablets direkt in der Werkstatt. Neben Sensordaten werden auch Multimediadaten, wie Fotos oder Videos, direkt im Arb...
متن کاملAutomatische Aufgabenkorrektur mit VIPLab
Das Ziel des ViPLab-Projektes der Universität Stuttgart [2] ist die Durchführung von Programmierübungen und elektronischer Prüfungen im ILIAS Lernmanagement-System der Universität Stuttgart. Historisch entstand das Projekt aus der Notwendigkeit heraus, Studierende in den Bachelor-Studiengängen so rasch wie möglich an Programmiersprachen und numerische Software wie Matlab heran zu führen, wofür ...
متن کاملEin lernendes System zur Verbesserung der Datenqualität und Datenqualitätsmessung
Insbesondere in der Finanzdienstleistungsbranche kommt einer guten Qualität der Datenhaushalte bereits heute eine herausragende Bedeutung zu. Die Relevanz von qualitativ hochwertigen Daten wird durch neue gesetzliche Rahmenrichtlinien, wie z. B. Basel II, und durch Umbrüche in der Bankenund Versicherungslandschaft verstärkt. In dem folgenden Artikel wird ein System vorgestellt, das Datenqualitä...
متن کاملModellbasierte Oberflächen für Abnahmetests
Die Durchführung von Tests ist eine Voraussetzung zur Erstellung qualitativ hochwertiger, nicht trivialer Softwaresysteme. Das modellgetriebene Testen ermöglicht eine hohe Testabdeckung bei gleichzeitiger Abstraktion von der zu testenden Implementierung, was insbesondere beim Testen innerhalb von Produktfamilien von Vorteil ist. Als Alternative zur vollständigen Generierung von Testmodellen ste...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2017